Day16神經網路的機制

2024 iThome 鐵人賽

AI/ ML & Data

了解AI–道阻且長系列第 16 篇

16th鐵人賽

lwc_

2024-10-15 12:22:19

596 瀏覽

分享至

靠特徵模式就可以識別圖像
特徵樣式正是神經網路分辦圖像的原理。這種像素的模式又叫做「用來分辦狗和貓的特徵模式（feature pattern)。事實上，就算是外貌稍有不同的狗或貓，我們仍可透過有沒有特徵樣式來辨別對象是狗還是貓。
以下將簡單說明為何如此。
當我們讀取一張新的圖像時，會透過以下的機制辦認出圖像中的動物是狗。下圖中，圖像中的黑色鼻子與狗的特徵樣式「黑鼻頭」一致，但圖像中卻沒有和貓的特徵樣式一致的部分。

透過上述的內容，神經網路可以是別出新輸入的圖像是狗，簡單來說就是只靠特徵去判斷。
如前所述，只要檢查特徵樣式的部分，就可以識別出這張圖像是狗還是貓。
因此這裡就讓我們用隱藏層中的三個神經元，分别負責檢查這三種特徵樣式吧
隱藏層最上面的神經元（簡稱1號）負責偵測圖像中是否有「黑鼻頭」。同樣的，隱藏層從上算起的第二、第三個神經元（簡稱2號、3號）分別負責偵測圖像中是否有「左右鬍鬚」、「w嘴」。分配好各個神經元的工作後，就用箭頭連接起輸入層、隱藏層、輸出層，如下所示。
輸出層中，從第一個是「看到『狥』的圖像時會産生反應」的神經元，因此它會和隱藏層中負責偵測「黑鼻頭」的1號用箭頭相連。
輪出層中，從第二個是「看到『貓』的圖像時會產生反應」的神經元機器人，因此它會和隱藏層中負責偵測「左右鬍鬚」、「w嘴」的2號、3號用箭頭相連。
要注意的是，正常來說任一要素都應該要連結到相鄰層的每個要素才對。不過其他箭頭細到可以忽略，所以只保留剩下的箭頭。
接下來，讓我們試著把剛才的狗的圖像放入輸入層的記憶體內讀取。如下一頁的圖所示，由「黑鼻頭」這個特徵所發送出來的訊號會經過較粗的箭頭，傳送到「會對狗的圖像產生反應」的輸出層神經元。

相對的，這張圖並没有貓的特徵「w嘴」、「鬍鬚」，不會發送出相關訊號，所以「會對貓的圖像產生反應」的輸出層神經元2不會收到任何訊號。
就這樣，輸入層讀取狗的圖像時，會傳送較強的訊號給輸出層的神經元1，使「會對狗反應」的神經元1產生反應。相對的，「面對貓反應」的神經元2則不會反應。因此，只要看輸出層中這兩個神經元機器人的反應情況，就可以判斷出輸入的圖像是狗。
由以上過程可以得知，「即使是單純的機制，只要能建構成網路，就能擁有智慧」。